تخمین اطمینان خروجی ترجمه ماشینی با استفاده از ویژگی های جدید ساختاری و محتوایی

Authors

مرضیه صالحی

marzieh salehi alzahra universityتهران-خ پیروزی-میدان بروجردی-خ اندرزگو-ک مرتضوی-ک ریحانی پور-پ 18 شهرام خدیوی

shahram khadivi amirkabir universityدانشگاه امیرکبیر نوشین ریاحی

nooshin riahi alzahra universityدانشگاه الزهرا(س)

abstract

با وجود پیشرفت های اخیر در حوزه ترجمه ماشینی، این تکنولوژی قادر به ترجمه دقیق متون نیست و گاهی ممکن است ویرایش خروجی آن زمان بیشتری نسبت به ترجمه دستی بگیرد. با این حال با داشتن تخمینی از کیفیت خروجی، کاربران می توانند به طور مناسبی با ناکامل بودن این تکنولوژی برخورد کنند. برای کاربردهایی که هدف آنها بالا بردن کیفیت ترجمه ماشینی است، نظیر ترکیب خروجی سامانه های ترجمه گر مختلف، بازترتیب لیست چند ترجمه بهتر و بازتولید خروجی، لازم است که بدون داشتن ترجمه مرجع تخمینی از درستی خروجی داشته باشیم. هنوز روش کارامدی برای تخمین درستی کلمات خروجی ترجمه ماشینی وجود ندارد. در این مقاله 5 گروه ویژگی جدید در قالب ویژگی های مبتنی بر محتوا و مبتنی بر ساختار ارائه شده است. نتایج نشان می دهد که ویژگی مبتنی بر محتوا نسبت به بهترین سامانه پایه (2) برتری 63/9 درصدی در cer، 5/8 درصدی در f-measure و 1/5 درصدی در f-measure طبقه منفی داشته است. همچنین ترکیب ویژگی های مبتنی بر ساختار ارائه شده، در مقایسه با بهترین سامانه پایه به ترتیب بهبود 59/4، 1/4 و 2 درصدی در معیارهای cer، f-measure و f-measure طبقه منفی ایجاد کرده است.

Upgrade to premium to download articles

Sign up to access the full text

Already have an account?login

similar resources

تخمین اطمینان خروجی ترجمه ماشینی

به دلیل ابهام ذاتی موجود در زبان طبیعی، تقریبا همه فناوری های پردازش زبان طبیعی ناکاملند. با این حال با تخمینی از کیفیت خروجی، کاربران می توانند به طور مناسبی با ناکامل بودن آنها برخورد کنند. زمینه تحقیقاتی که به این مسئله می پردازد تخمین اطمینان نامیده می شود. هدف اصلی تخمین اطمینان کاربردی تر کردن فناوری های ناکامل است. در حوزه ترجمه ماشینی نیز با وجود پیشرفت های به دست آمده در سال های اخیر، ...

15 صفحه اول

نگرشی بر ترجمه ماشینی

از دیر باز بشر همیشه در آرزوی اختراع دستگاهی بوده است که بتواند متون را از زبان مبداء به زبان مقصد با سرعت و دقت فراوان ترجمه کند. تلاش برای رسیدن به این آرزو بیش از پنج دهه است که آغاز شده است و محققان دسا اوردهایی در زمینه طراحی سیستم ها و ساخت ماشین های مترجم بدست آورده اند ولی نام ماشینهای مترجم همواره مفهوم منفی را در ذهن افراد تداعی می کند و بیشتر مترجمان و محققان نظر منفی درباره ماشینهای...

full text

خوشه‌بندی محتوایی-ساختاری گراف و معیاری جدید جهت ارزیابی آن

امروزه با گسترش شبکه‌های اجتماعی در بین مردم، تلاش‌های مخالفین برای بدبین کردن ایشان نسبت به حکومت که از آن به عنوان جنگ نرم یاد می‌شود افزایش یافته است، بنابراین توجه به این شبکه‌ها برای ارگان‌های نظامی و امنیتی بیش از پیش اهمیت دارد. خوشه‌بندی گراف از جمله اولین کارهای تحلیلی یک یا چند شبکه اجتماعی است. متأسفانه اکثر خوشه‌بندی‌های گرافی انجام شده بر روی جنبه‌های ساختاری یا محتوایی گره‌های گرا...

full text

ترادف نوکلئوتیدی و ویژگی های ساختاری دو واریانت جدید ویروئید کوتولگی رازک از مرکبات استان فارس

ویروئید کوتولگی رازک (HSVd) در سال های اخیر به عنوان عامل همراه با بیماری های زرد و چوب پنبه ای شدن رگبرگ در درختان پرتقال واشنگتن ناول و شقاقی شدن پوست لیموشیرین از مرکبات استان فارس و به عنوان عامل بیماری کاککسیای مرکبات از استان مازندران گزارش گردیده است که نشان دهنده اهمیت این عامل بیماری زا در ایران است. در این مطالعه تعدادی نمونه بدون علائم مشخص از باغ های مرکبات استان فارس از نظر وجود وی...

full text

My Resources

Save resource for easier access later


Journal title:
پردازش علائم و داده ها

جلد ۱۲، شماره ۳، صفحات ۱۰۹-۱۲۱

Hosted on Doprax cloud platform doprax.com

copyright © 2015-2023